iT邦幫忙

2024 iThome 鐵人賽

DAY 7
1

模型這兩個字常常出現在數據人的生活中,當資料分析師聽到它時,很多人第一個想到的詞彙應該是機器學習模型 / 統計模型。但這裡提到的資料模型 (data model )卻是完全不一樣的概念。在我介紹什麼是資料模型前,我想先偷渡一下我和「模型」的相遇、相識、相知以及相惜,畢竟除了鐵人賽,我好像也沒機會講述這段歷史了。

https://ithelp.ithome.com.tw/upload/images/20240921/20163103BbhY0PFi7D.jpg

我與「模型」的相遇、相識、相知以及相惜

第一次與「模型」相遇,是在高三要選擇科系時,那時候在「經濟系」的科系介紹,看到經濟系是一門可以用數學模型模擬人類如何決策的社會科學。那時候看到可以用數學模擬人是如何決策的,就覺得很酷,彷彿要墜入愛河一般。
我也記得,當時個人申請做面試練習時,有一題的題目是「 請簡單描述一下什麼是模型,以及你對經濟學模型的基本認識。」我記得我每次回答時,都免不了用「模型」這兩個字去解釋模型,當時回答得有點受挫,也有點質疑我對他的愛到底是不是真的。
而當經濟系唸了一段時間後,也越來越了解模型所代表的意思,所謂的經濟學模型是經濟學家透過對社會 / 人類的觀察,建構數學的等式 (Equation)來推論,為什麼社會會出現某種現象,人為什麼會做出某些行為。所謂的物理學模型,或是各種自然科學模型,似乎都能這樣解釋。當時對我來說,模型就是一種數學上的建構,等式的背後隱藏著人們對這個世界的觀察以及假設。

https://ithelp.ithome.com.tw/upload/images/20240921/20163103RwTndd4y2r.png

事實上最基礎的機器學習模型或是統計模型也是如此,建構好數學等式後,將大量的資料餵入,找出哪些特徵會影響結果,進而去預測結果。

但當我在第一份工作遇到 dbt ,他在講解何謂 data modeling 時,「模型是數學上的建構」這個解釋時,就出現了違和感。簡單說, dbt 就是透過讓使用者利用 Select 敘述句 在資料庫中將成用的商業邏輯 / 資料轉換邏輯 建成 View / Table,如此一來分析師就可以直接取用就可以直接取用這些 View / Table,不再需要每次做報告時,都要寫同樣的程式碼來做同樣的商業邏輯轉換。而其中,在資料庫中將成用的商業邏輯 / 資料轉換邏輯 建成 View / Table,就是 data modeling 的一種。當時的我只心想,這個 data model 到底在 model 什麼?

什麼是模型

回到原題,所以如果現在有人問我:「模型是什麼呢?」我會說:模型是一種以簡馭繁,它試著著用簡單的架構去模擬繁複的真實世界。從這個角度來看,數學式可以是模型,ERD 可以是模型,甚至連短篇小說也是模型。怎麼樣算是好的模型呢?就看我們想模擬的現實世界的哪一部分,模擬得像不像了。

所以最後關於這個「什麼是模型」的結論到底是怎麼得到的,還有資料模型到底是什麼呢?之後的系列文將會帶大家了解資料模型,以及他在商業智慧以及資料倉儲中扮演的角色。


上一篇
Day 6 - 業務流程與指標之北極星指標
下一篇
Day 8 資料模型 - 什麼是資料模型
系列文
華人市場資料打撈師求生指南12
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言